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Beschreibung 

Verfahren und Vorrichtung zur Strukturierung von Texten 

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur 
Uberfuhrung unstrukturierter Textinf ormationen in ein struk- 
turiertes Format. 

Insbesondere in der Medizintechnik werden heutzutage viele 
Freitext-Reporte erstellt, die beispielsweise durch Einsatz 
von Diktaphonen und/oder Spracherkennungs-Technologien im 
Computer erfasst werden. Das Problem beim Umgang mit diesen 
Reporten besteht darin, dass ein automatischer Zugriff auf 
kleine Inf ormationsteile, sogenannte atomare Inf ormationen, 
nahezu unmoglich ist, da der Inhalt keine bzw. nur eine sehr 
grobe Struktur enthalt. Somit sind Freitext-Reporte fur die 
strukturierte Darstellung und Auswertung der Inf ormationen 
sehr ungeeignet. 

Bei derartigen Freitext-Reporten werden lediglich ganzheitli- 
che Informationen verarbeitet. Sie konnen nicht zu automati- 
schen Auswertungen herangezogen werden, so dass die in ihnen 
enthaltenen Informationen somit fur diesen Zweck verloren 
sind. Dieses Problem wachst in dem Mafie, wie das Bedurfnis 
nach Zugriff auf die atomare Information beispielsweise zum 
Zwecke eines Kodierens steigt. 

Die Erfindung geht von der Aufgabe aus, ein Verfahren und 
eine Vorrichtung der eingangs genannten Art zu schaffen, die 
eine einfache, automatisierte Uberfuhrung unstrukturierter 
Textinformationen von Freitext-Reporten in ein strukturier- 
tes, auswertbares Format ermoglicht. 

Die Aufgabe wird erf indungsgemaft durch ein Verfahren mit fol- 
genden Schritten gelost: 

a) Eingabe von Strukturierungsregeln zur Strukturierung der 
unstrukturierten Textinformationen, 
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b) Erfassen unstrukturierter Textinf ormationen, 

c) Parsen der unstrukturierten Textinf ormationen zur Erzeu- 
gung kleiner Text f ragmenten, 

d) Durchsuchen von Texteinheiten der unstrukturierten Textin- 
formationen nach in den Strukturierungsregeln definierten 
Text f ragmenten, 

e) Strukturierung der Text f ragmente der unstrukturierten 
Textinformationen gemaB in den Strukturierungsregeln fest- 
gelegten Bedingungen. 

Durch die zu def inierenden Strukturierungsregeln wird der 
Freitext-Report geparst, d.h. in kleinere Einheiten zerlegt, 
und in eine Struktur uberfiihrt, damit ein Programm diese In- 
formationen auswerten kann. Eine solche Regel enthalt Infor- 
mationen zu den Textf ragmenten, nach denen der Freitext-Re- 
port zu durchsuchen ist, welches Struktur-Element hierdurch 
reprasentiert wird, sowie zusatzliche Inf ormationen daruber, 
wie die Struktur aufzubauen ist. 

Erf indungsgemafi kann im Schritt b) die Erfassung von unstruk- 
turierter Textinformationen durch ein Mikrophon erfolgen, wo- 
bei mittels eines Spracherkennungsprogramms eine Umsetzung in 
unstrukturierte Textinformationen durchgefuhrt wird. 

In vorteilhaf ter Weise konnen die Strukturierungsregeln In- 
formationen zu den Textf ragmenten enthalten, nach denen der 
Freitext-Report zu durchsuchen ist, welches Struktur-Element 
hierdurch reprasentiert wird und wie die Struktur aufzubauen 
ist . 

Die Aufgabe wird bezuglich der Vorrichtung erf indungsgemaft 
durch eine Eingabevorrichtung fur unstrukturierte Textinfor- 
mationen, eine Eingabevorrichtung und Speichervorrichtung fur 
Strukturierungsregeln, eine Extraktionsvorrichtung von klei- 
nen Texteinheiten aus den unstrukturierten Textinformationen, 
eine Strukturierungsvorrichtung zur Erzeugung strukturierter 
Textinformationen aufgrund der Strukturierungsregeln und eine 
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Auswertevorrichtung fur die Texteinheiten in den strukturier- 
ten Textinf ormationen gelost. 

Eine Eingabe von auswertbaren unstrukturierten Textinf ormati- 
onen kann direkt erfolgen, wenn der Eingabevorrichtung fur 
unstrukturierte Textinf ormationen eine Vorrichtung zur 
Spracherkennung zugeordnet ist. 

Es hat sich als vorteilhaft erwiesen, wenn fur die struktu- 
rierten Textinf ormationen als strukturiertes Format DICOM-SR 
oder XML Verwendung findet. 

Die Erfindung ist nachfolgend anhand von in der Zeichnung 
dargestellten Ausf iihrungsbeispielen naher erlautert. Es zei- 
gen : 

Figur 1 eine erfindungsgemafie Vorrichtung zur Strukturie- 
rung von Texten und 

Figur 2 ein erf indungsgemafies Verfahren zur Strukturierung 
von Texten. 

In der Figur 1 ist eine erf indungsgemafte Vorrichtung zur 
Strukturierung von Texten dargestellt, die beispielsweise in 
einem Personal Computer (PC) realisiert sein kann. Eine Tas- 
tatur 1 dient zur Eingabe von Strukturierungsregeln und ggf . 
von Freitext-Reporten . Weiterhin kann die Vorrichtung eine 
Sprach-Eingabevorrichtung 2 aufweisen, beispielsweise ein 
Mikrophon oder ein Kassetten-Abspielgerat aufweisen, durch 
die die Freitext-Reporte in den PC eingegeben werden konnen. 
An die Sprach-Eingabevorrichtung 2 ist eine Vorrichtung 3 zur 
Spracherkennung, beispielsweise mit einem Spracherkennungs- 
programm, angeschlossen, mittels derer die gesprochenen Frei- 
text-Reporte in Textinf ormationen umgesetzt werden konnen. 

Die Tastatur 1 ist mit einer Speichervorrichtung 4 fur Struk- 
turierungsregeln und einer Speichervorrichtung 5 fur Textin- 
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formationen verbunden, an die auch die Vorrichtung 3 zur 
Spracherkennung angeschlossen ist. Mit der Speichervorrich- 
tung 5 fur Textinf ormationen ist eine Extraktionsvorrichtung 

6 verbunden, die aus den unstrukturierten Textinf ormationen 
kleine Texteinheiten erkennt und kennzeichnet . An der Extrak 
tionsvorrichtung 6 und der Speichervorrichtung 4 fur die 
Strukturierungsregeln ist eine Strukturierungsvorrichtung 7 
zur Erzeugung strukturierter Textinf ormationen angeschlossen 
die aufgrund der festgelegten und gespeicherten Strukturie- 
rungsregeln die extrahierten Texteinheiten in ein struktu- 
riertes Format uberftihrt. Mit der Strukturierungsvorrichtung 

7 ist eine Auswertevorrichtung 8 verbunden, die eine Abfrage 
nach kleinen, strukturierten Texteinheiten zur weiteren Aus- 
wertung ermoglicht . 

In einer medizinischen Einrichtung werden Freitext-Reporte 
beispielsweise mit Hilfe eines Diktiergerates (Dictaphones) 
aufgezeichnet und spater von einer Sekretarin mittels eines 
Schreibprogramms iiber die Tastatur 1 in den Computer ubertra- 
gen. Eine Umwandlung eines Freitext-Reports in einen ge- 
schriebenen Text kann auch durch die Vorrichtung 3 zur 
Spracherkennung mit einem entsprechenden Spracherkennungspro- 
gramm erfolgen, wobei der Freitext-Report direkt in einen 
Personal Computer mittels Diktat oder nachtraglich mit einem 
Abspielgerat fur Diktierkassetten eingegeben werden kann. 

Urn spatere Auswertungen der so entstandenen Datenbestande zu 
ermoglichen, werden die Freitext-Reporte neben ihrem Origi- 
nalformat in ein strukturiertes Format, beispielsweise DICOM- 
SR oder XML, uberfuhrt. Hierzu werden Regeln definiert, die 
die Systematik der Uberfuhrung festlegen. 

Ausgangspunkt sind in der Figur 2 dargestellte unstrukturier- 
te Textinformationen 9, welche mittels Diktat bzw. Freitext- 
eingabe entstanden ist. Diese Textinformationen 9 dient als 
Input fur eine Vorrichtung, die diese unstrukturierten Text- 
informationen 9 in eine strukturierte Form ubersetzen soil. 
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in der Figur 2 ist Folgendes als Beispiel fur unstrukturierte 

Textinformationen 9 angegeben: 

Indikation: Diaphorese. Ausschluss von Abnormalitaten 
regionaler Wandbewegungen . Uberpriifen hypertonischer 
Kardiomyopathie. Ausschluss myokardialen Infarkt. Beur- 
teilen des linken des Auswurf anteils des linken Ventri- 
kels. Ausschluss eines Aneurysma des linken Ventrikels. 
Historie: Andere sachbezogene Historien beinhalten: 
neuerlicher Kokainmissbrauch . Vorhergehende CV- 
Prozeduren: 

Studieninfo. Die Studie wurde unter generaler Anasthe- 
sie durchgefuhrt . 

Zur Ubersetzung dieser unstrukturierten Textinformationen 9 
in eine strukturierte Form werden in diese Vorrichtung Struk- 
turierungsregeln 10 liber die Tastatur 1 eingegeben und in der 
Speichervorrichtung 4 gespeichert, welche die Grundlage der 
Obersetzung bilden. 

Diese Strukturierungsregeln 10 definieren, nach welchen Text- 
fragmenten im Text zu suchen ist und welches Ergebnis das 
Auffinden eines solchen Textf ragmentes in der Ubersetzung 
hat. im nachfolgend beschriebenen Beispiel bedeutet bei- 
spielsweise das Auffinden des Textf ragmentes "Indikation" 
Oder "indications", dass eine neues Element, welches eine In- 
dikation beschreibt, in die Struktur eingefugt wird. 

im Folgenden sind Beispiele von derartigen Strukturierungsre- 
geln 10 angegeben, die in der Figur 2 dargestellt sind. Die 
allgemeine Grundlage ist, dass Strukturierungsregeln 10 defi- 
niert werden, welche auf der Basis des Auffindens von Text- 
fragmenten festlegen, wie unstrukturierte Textinformationen 9 
in eine strukturierte Form ilbertragen werden. 

Steht im Text das Wort "Indikation", so ist es unter Element 
"indikation" mit offenen Aktionen zu behandeln. Gleiches gilt 
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fttr das Wort "Historie" als Element "Historie" und "Studien- 
info" als Element "Studieninfo" . 

Steht im Text das Wort "Diaphorese" , so 1st es unter Element 
.■indication" als Action einzufUgen. Das Wort "Kokainmxss- 
brauch" im Text ist unter Element "Historie-Eintrag exnzufu- 
gen. Der Begriff "generale Anasthesie" 1st unter Element 
"Studieninfo" einzufugen 

Hit diesen und weiteren einmal eingegebenen, jedoch jederzeit 
anderbaren Strukturierungsregeln 10 werden unstrukturxerte 
/ T extinformationen 9 des Ereitext-Reports in eine -trutturxer- 
I te Form gebracht, so dass man in den nun erhaltenen nachfol 

gend beschriebenen strukturierten Textinf ormatxonen 11 nach 
15 bestimmten Begriffen suchen kann. 
<Report> 
<Indikationen> 

<Indikation> Dia P horese</ Indikation >. Ausschluss von 
Abnormalitaten regionaler Wandbewegungen. Uberprufen hy- 
pertonischer Kardiomyopathie . Ausschluss myokardxalen 
infarkt. Beurteilen des linken des Auswurf anteils des 
linken Ventrikels. Ausschluss eines Aneurysma des Ixnken 

Ventrikels . 
</Indikationen> 

<Historie> . 
Andere sachbezogene Historien beinhalten: neuerlxcher 
<Historie-Eintrag> Kokainmissbrauch <Historie-Exntrag> . 
Vorhergehende CV-Prozedur (en) : 
</Historie> 

<Studieninfos> .. 
Die Studie wurde unter <Studieninf o> generaler Anasthe- 
sie <Studieninfo> durchgefiihrt . 
</Studieninfos> 
</Report> 

35 Es 1st also ein automatisoher Zugriff auf ato.are ^for.atio- 
nen mOglich, da der Inhalt durch die erf indungsgemaBe Vor- 
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richtung eine fein strukturierte Form erhalt. Somit lassen 
sich auch Freitext-Reporte fur eine strukturierte Darstellung 
und automatische Auswertung der Inf ormationen einsetzen. 
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Patentanspruche 

1. Verfahren zur regelbasierten Uberfuhrung unstrukturierter 
Textinformationen in ein strukturiertes Format mit folgenden 
Schritten : 

a) Eingabe von Strukturierungsregeln (10) zur Strukturierung 
der unstrukturierten Textinformationen (9), 

b) Erfassen unstrukturierter Textinformationen (9), 

c) Parsen der unstrukturierten Textinformationen (9) zur Er- 
zeugung kleiner Textf ragmenten, 

d) Durchsuchen von Texteinheiten der unstrukturierten Textin- 
formationen (9) nach in den Strukturierungsregeln (10) de- 
finierten Text f ragmenten, 

e) Strukturierung der Text f ragmente der unstrukturierten 
Textinformationen (9) gemafl in den Strukturierungsregeln 
(10) festgelegten Bedingungen, 

2. Verfahren nach Anspruch 1, dadurch g e - 
kennzeichnet, dass im Schritt b) die Erfassung 
von unstrukturierter Textinformationen (9) durch ein Mikro- 
phon erfolgt, wobei mittels eines Spracherkennungsprogramms 
eine Umsetzung in unstrukturierte Textinformationen durchge- 
ftthrt wird. 

3. Verfahren nach Anspruch 1 oder 2, dadurch 
gekennzeichnet, dass die Strukturierungsre- 
geln (10) Informationen zu den Textf ragmenten enthalten, nach 
denen der Frei text-Report zu durchsuchen ist. 

4. Verfahren nach einem der Anspriiche 1 bis 3, da- 
durch gekennzeichnet, dass die 
Strukturierungsregeln (10) Informationen zu den Textf ragmen- 
ten enthalten, welches Struktur-Element hierdurch reprasen- 
tiert wird. 

5. Verfahren nach einem der Anspriiche 1 bis 4, da- 
durch gekennzeichnet, dass die 
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Strukturierungsregeln (10) Inf ormationen enthalten, wie die 
Struktur aufzubauen ist. 

6 . Vorrichtung zur regelbasierten Uberfuhrung unstrukturier- 
ter Textinf ormationen in ein strukturiertes Format mit einer 
Eingabevorrichtung (1, 2) fur unstrukturierte Textinf ormatio- 
nen (9), mit einer Eingabevorrichtung (1) und Speichervor- 
richtung (4) fur Strukturierungsregeln (10), mit einer Ex- 
traktionsvorrichtung (6) von kleinen Texteinheiten aus den 
unstrukturierten Textinf ormationen, mit einer Strukturie- 
rungsvorrichtung (7) zur Erzeugung strukturierter Textinf or- 
mationen (11) aufgrund der Strukturierungsregeln (10) und mit 
einer Auswertevorrichtung (8) fur die Texteinheiten in den 
strukturierten Textinf ormationen (11) . 

7. Vorrichtung nach Anspruch 6, dadurch g e - 
kennzeichnet, dass der Eingabevorrichtung (2) 
fur unstrukturierte Textinf ormationen (9) eine Vorrichtung 
(3) zur Spracherkennung zugeordnet ist. 

8. Vorrichtung nach Anspruch 6 oder 7, dadurch 
gekennzeichnet, dass fur die strukturierten 
Textinf ormationen (9) als strukturiertes Format DICOM-SR Ver- 
wendung findet. 

9. Vorrichtung nach einem der Anspruche 6 bis 8, da- 
durch gekennzeichnet, dass fiir die 
strukturierten Textinf ormationen (9) als strukturiertes For- 
mat XML Verwendung findet. 



200214868 

1/2 



FIG1 



200214868 

2/2 



FIG 2 



Indikation: Diaphorese. Ausschluss von Abnormalitaten regionaler Wandbewegungen. 
Uberprufen hypertonischer Kardiomyopathie. Ausschluss myokardialen Infarkt. Beurteilen 
des linken des Auswurfanteils des linken Ventrikels. Ausschluss eines Aneurysma des lin- 
ken Ventrikels. Historie: Andere sachbezogene Historien beinhalten: neuerlicher Ko- 
kainmissbrauch. Vorhergehende CV-Prozeduren: 
Studieninfo. Die Studie wurde unter generaler Anasthesie durchgefuhrt. 




Regel 1 




Regel 2 


Text = Jndikation" 
Element = Jndikation" 
Aktionen = „Offen" 




Text = „Historie" 
Element = „Historie" 
Aktionen = „Offen" 



Regel 3 



Text = „Studieninfo" 
Element = „Studieninfo" 
Aktionen = „Offen" 



Regel 4 



Text = „ Diaphorese" 
Element = Jndikation" 
Aktionen = „Einfugung" 



Regel 1?? 



Text = M Kokainmissbrauch" 
Element = „Historie-Eintrag" 
Aktionen = „Einfugung" 



Regel 1 



Text = „generale Anasthesie" 
Element = M Studieninfo" 
Aktionen = „Einfugung" 
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<Report> 
<lndikationen> 

<lndikation> Diaphorese</ Indikation >. Ausschluss von Abnormalitaten regionaler Wand- 
bewegungen. Uberprufen hypertonischer Kardiomyopathie. Ausschluss myokardialen 
Infarkt. Beurteilen des linken des Auswurfanteils des linken Ventrikels. Ausschluss 
eines Aneurysma des linken Ventrikels. 

</lndikationen> 

<Historie> 

Andere sachbezogene Historien beinhalten: neuerlicher <Historie-Eintrag> Kokainmiss- 

brauch <Historie-Eintrag>. Vorhergehende CV-Prozedur(en): 
</Historie> 
< Studieninfos > 

Die Studie wurde unter <Studieninfo> generaler Anasthesie <Studieninfo> durchgefuhrt. 

</Studieninfos> 

</Report> 
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